Fusion de ressources hétérogènes pour la recherche d'information multilingue
نویسندگان
چکیده
RÉSUMÉ. Afin d’améliorer la recherche multilingue dans le moteur de recherche Sinequa Engine, nous avons intégré les connaissances multilingues du service Sensagent au module de requêtes du moteur de recherche Sinequa Engine. L’interface développée propose une extension de la requête aux choix de l’utilisateur par traduction des différents mots dans les langues sélectionnées. Pour limiter le grand nombre de traductions que peut engendrer une requête complexe, nous avons déployé un filtrage sémantique par calcul vectoriel. L’ensemble de la chaîne de traitement repose fortement sur les ressources linguistiques de Sinequa. L’utilisation d’une ressource extérieure, si elle résout le problème de la seule traduction, pose des problèmes d’exploitation et d’adéquation des ressources entre elles, qui ne pourraient être résolus que par une vraie fusion des ressources.
منابع مشابه
Une Architecture Basée Agents Mobiles Pour la Recherche d'Information dans des Sources Hétérogènes et Réparties
Résumé. De nos jours le besoin en information devient très exigeant et l'interopérabilité des systèmes devient une approche incontournable. Une demande d'information peut être répartie sur plusieurs systèmes répartis d'où la nécessité d'une reconstitution de la réponse par une entité gérante. D'autre part, les échanges des données et la répartition des tâches d'une application distribuée nécess...
متن کاملUtilisation des ressources externes pour la reformulation des requêtes dans un système de recherche d'information
Dans un Système de Recherche d’Information (SRI), les démarches pour la reformulation de la requête sont nombreuses. Elles peuvent être classées selon les ressources utilisées en trois grandes approches : l’utilisation des ressources externes, l’analyse globale et l’analyse locale. Dans ce contexte et dans le cadre des SRI pour les textes Arabes, nous nous intéressons à l’évaluation des perform...
متن کاملExpansion de requêtes pour la recherche d'information multilingue
1. Recherche d'information multilingue : approche par traduction des contenus La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues dans lesquelles ces contenus sont disponibles. En revanche, la complexité des requêtes reste limitée (2 à 3 mots en moyenne). Des traitements spécifiques s'avèrent donc nécessaires pour préciser le sens de certaines requêtes, ou a...
متن کاملRecherche d'information médicale pour le patient: Impact de ressources terminologiques
RÉSUMÉ. Le droit d’accès au dossier clinique par les patients est inscrit dans le code de Santé Publique. Cependant, ce contenu reste difficile à comprendre. Nous proposons une expérience, où les requêtes des patients sont utilisées pour retrouver les documents pertinents. Nous utilisons le moteur de recherche Indri, basé sur le modèle statistique de la langue, et des ressources sémantiques. L’...
متن کاملRecherche approchée d'information dans une base de documents semi-structurés
RÉSUMÉ. Nous proposons des algorithmes dédiés à l'indexation et à la recherche approximative d'information dans les bases de données hétérogènes semi-structurées XML. Le modèle d'indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d'arbres. Les mécanismes de recherche approchée mis en œuvre s’appuient sur une distance de Levenshtein ...
متن کامل